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多 源 评价 的 特点 与 内 在 机 制 


( 西南 财经 大 学 工商 管理 学 院 , 成 都 611130) C 中 国 科学 技术 大 学 管理 学 院 , 合肥 230026) 


摘 要 多 源 评价 在 国外 企业 中 的 运用 已 日 益 成 熟 ,但 在 我 国 还 停留 在 探索 与 发 展 阶 段 。 基 于 已 有 的 研究 发 
SL, 围绕 评价 过 程 、 评 价 源 及 被 评价 者 三 方面 对 多 源 评价 的 特点 及 内 在 机 制 进行 了 探讨 与 分 析 。 从 评价 过 程 
看 ， 其 评价 目的 具有 多 重 性 , 评价 形式 注重 匿名 性 ， 且 评价 结果 的 合理 应 用 非常 重要 ; 从 评价 源 看 ,不 同 评价 
源 间 的 评价 一 致 性 较 低 ， 且 吻 造 成 渐 轮 效应 和 宽大 效应 ; 从 被 评价 者 来 看 , 个体 对 多 源 评 价 结 果 的 反应 ， 受 
到 个 性 特征 、 反 馈 信 号 及 自我 -他 人 评价 间 差 距 等 因素 影响 。 研究 也 发 现 ， 多 源 评价 所 带 来 的 绩效 改进 结果 具 
有 不 稳定 性 。 基 于 此 ， 如 何 提高 多 源 评价 过 程 的 有 效 性 与 准确 性 , 改善 评价 者 对 评价 结果 的 反应 ， 以 及 如 何 对 
多 源 评 价 结果 进行 有 效 汇 总 等 是 未 来 值得 研究 的 重要 内 容 。 
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BECH (2001) T 360 度 反馈 在 人 力 资源 管理 
中 的 效用 ， 以 及 在 中 国文 化 背景 下 的 实施 策略 ; 
Mice ven eRe ye eI F 庆 瑞 等 (2002) 对 多 源 评价 中 不 同 的 评价 源 特征 
人 条件 下 ， 对 员工 的 绪 效 评价 主要 为 上 级 评价 模式 。 及 缺点 进行 了 分 析 ， 并 针对 不 同 的 组 织 环境 对 多 
(top-down appraisal). (ABA AW AE, xe HE 源 评 价 方式 进行 了 匹配 。 然 而 ， 目 前 国内 关于 多 
六 方式 的 出 现 ， 上 级 无 法 拥有 员工 的 完整 信息 ， 。 源 评价 的 定量 研究 , 却 几乎 没有 ; 这 与 国外 的 研 
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不 能 对 员工 作出 客观 公正 的 评价 ( 许 庆 瑞 ， 王 勇 ， 究 文 献 产生 了 很 大 的 反差 。 本 文 基于 国外 关于 多 


陈 劲 ，2002)， 因 此 拥有 多 个 评价 源 的 评价 模式 应 源 评价 的 实证 研究 ， 从 评价 过 程 .评价 源 ! 及 被 评 
运 而 生 。 多 源 评价 /反馈 (multisource feedback), 包 价 者 三 方面 ， 对 国外 多 源 评价 的 特点 及 内 在 机 制 
括 360 度 、270 度 或 180 度 评价 (Markham, Smith, 进行 探讨 ， 旨 在 总 结 现 有 研究 的 不 足 ， 并 提出 未 
Markham, & Braekkan, 2014)， 指 被 评价 者 受到 来 来 的 研究 方向 。 针 对 内 在 机 制 ,本 文 主要 围绕 评 
自 上 级 、 同 事 、 自 我 、 下 级 及 顾客 的 多 角度 评价 价 结果 ， 分 析 评 价 过 程 、 评 价 源 对 于 评价 结果 的 
(London & Smither, 1995)。 据 统 计 , 全 球 500 强 企 影响 , 评价 者 对 评价 结果 反应 的 影响 因素 ， 以 及 
业 中 ,有 90% 的 企业 都 在 使 用 多 源 评价 (Maylett， 各 因素 间 的 相互 作用 ， 如 图 1 所 示 。 

2009)。 相 对 于 传统 的 上 级 评价 来 说 ,多 源 评价 是 Seem dst 72 

多 个 评价 主体 同时 对 被 评价 者 的 绩效 进行 评估 ， ”2 多 源 评价 过 各 

因此 能 够 提供 更 准确 、 多 角度 的 描述 (Hoffman,， 2.1 评价 目的 

Lance, Bynum, & Gentry, 2010)。 多 源 评价 最 初 主要 以 帮助 员工 自身 发 展 为 目 
目前 ,我 国 对 多 源 评价 的 研究 还 较 少 ， 且 大 的 (London & Smither，1995), 通过 识别 员工 的 优 
多 属于 定性 研究 .如 刘 凤 瑜 (2000) 对 360 度 反馈 的 缺点 ， 制 定 相应 的 绩效 改进 计划 ， 以 促进 员工 发 
基本 原理 与 过 程 进行 了 阐述 ; 陆 昌 勤 、 方 俐 洛 和 展 。 如 Wong 和 Kwong (2007) 提 出 ， 多 源 评 价 应 
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价 过 程 中 , 一 般 以 李 克 特 量 表 的 形式 ,让 评价 者 
进行 打分 ,但 Brown, Inceoglu 和 Lin (2017) 提 出 , Æ 

村 量 表 会 带 来 较 强 的 反应 偏差 (response biases), 
而 采用 强迫 排序 (forced-choice ranking) 来 奉 代 李 
克 特 量 表 ， 能 降低 评价 误差 ， 从 而 提高 评价 者 间 
的 一 致 性 。 可 见 ， 从 改进 评价 量 表 形 式 的 角度 人 
F, 来 提高 评价 者 间 的 一 致 性 ， 是 未 来 研究 值得 
探讨 的 问题 。 另 外 , 在 反馈 结果 的 呈现 上 , Atwater 


等 (2007) 的 研究 结果 显示 ,相对 于 文字 型 的 反馈 
绩效 提升 结果 来 说 ,被 评价 者 更 喜欢 数字 型 的 反馈 ， 因 为 
a: Sanne 文字 型 的 反馈 常 表 达 得 含糊 不 清 ， 而 数字 型 的 反 


馈 则 更 为 具体 而 易 懂 。 
以 追求 和 谐 、 追 求 公 平 、 识 别 员工 优 缺点 及 激励 2.3 ”评价 后 的 引导 机 制 
员工 为 目的 。 随 着 多 源 评价 在 实际 运用 中 的 不 断 有 研究 发 现 , 在 多 源 评价 结束 几 个 月 之 后 ， 
发 展 ， 其 评价 目的 也 变 得 更 为 丰富 ,比如 , 不 少 企 大 多 员工 将 记 不 起 绩效 评价 的 结果 ,特别 是 关于 
业 开始 将 多 源 评价 运用 于 管理 目的 。London (2001) 其 弱点 方面 的 内 容 (Smither Brett, & Atwater, 
认为 多 源 评 价 既 适用 于 发 展 目 的 ,也 可 用 于 管理 2008)。 而 此 时 若 配 一 名 优秀 的 引导 者 (如 有 经 验 的 
目的 ,但 若 运用 到 管理 活动 中 则 需 花 费 更 多 时 老 员工 ), 将 会 提高 员工 对 反馈 结果 的 感知 有 用 性 
间 。 当 多 源 评价 以 员工 个 人 发 展 为 目的 时 ， 会 减 及 自我 意识 ， 降 低 其 对 负面 反馈 的 消极 情绪 ， 增 
少 评 价 者 和 被 评价 者 的 顾虑 ,评价 者 会 作出 更 诚 加 其 改进 动力 ， 从 而 最 终 获 得 绩效 提升 (Luthans 
实 的 评价 , 评价 结果 也 更 容易 被 接受 (Rogers，Rogers， & Peterson, 2003)。 另 外 ， 相 关 学 者 还 发 现 上 级 的 


= & Metlay 2002)。 而 当 多 源 评价 运用 于 管理 目的 时 ， ”领导 风格 或 行为 ,会 影响 员工 的 后 续 绩效 改进 行 
由 于 评价 结果 与 员工 的 奖金 、 晋 升 等 相关 , 为 了 _” 为。 如 教练 式 领导 风格 能 负 向 显著 地 影响 ， 员 工 
5 追求 和 谐 的 组 织 氛围 ,评价 者 往往 会 提高 对 员工 对 绩效 评价 中 组 织 政治 (organizational politcis) 的 
Py 的 评价 ， 从 而 更 易 导致 宽大 效应 的 出 现 (Chappelow， ”感知 ， 即 绩效 评价 过 程 是 否 公 正 严明 或 受到 其 他 
N 2004)。 有 趣 的 是 ， 最 近 研究 发 现 当 多 源 评价 同时 ”政治 因素 的 影响 (Russo，Miraglia, & Borgogni, 
J ] 于 管理 与 发 展 目的 时 ,被 评价 者 由 于 受到 两 大 ”2017); 而 领导 的 自主 支持 行为 , 会 促进 员工 的 反 
目的 的 同时 激励 ， 相 对 于 单一 评价 目的 来 说 , 评 。 ”人 馈 寻 求 行为 ,让 员工 更 主动 积极 的 ， 根据 反馈 结 
价 结果 对 员工 知识 共享 能 力 的 影响 将 增强 (Kim,， 果 来 提高 个 人 绩效 (Beenen, Pichler, & Levy, 2017)。 
< Atwater, Patel, & Smither, 2016)。 可 见 ， 多 源 评价 。 ”因而 ,在 员工 收 到 多 源 评价 结果 后 ,应 尽量 为 其 
v 的 评价 目的 由 单一 性 向 多 重 性 发 展 ,企业 在 运用 ”分配 一 名 优秀 的 引导 者 , 帮助 其 更 好 地 利用 评价 
= 多 源 评价 时 ,应 根据 自身 特点 及 发 展 需求 , 设立 。 ”结果 ,来 获得 自身 能 力 的 提高 。 同 时 , 领导 者 也 应 
= 多 重 而 清晰 的 多 源 评价 目的 。 以 身 作 则 ,通过 树立 良好 的 领导 风格 与 行为 ， 潜 
2 2.2 ”评价 形式 移 默 化 地 影响 员工 的 后 续 绩 效 改 进 活动 。 


在 多 源 评价 过 程 中 一 般 采 用 匿名 的 形式 进行 、 eee 
评价 ， 因 为 当 评价 者 得 知 个 人 信息 不 会 被 泄露 时 ， ”3 多 源 评价 中 的 评价 源 
他 们 会 作出 更 真实 而 准确 的 评价 (Brutus & Derayeh, 相对 于 传统 的 绩效 评价 ， 多 源 评价 的 最 大 特 
2002)。 特 别 是 下 级 评价 中 ， 当 下 级 员工 给 与 管理 。 点 就 是 拥有 不 同 的 评价 源 ， 关 于 顾客 这 一 评价 源 
者 较 低 评分 时 ， 常 担心 上 级 领导 的 报复 行为 , 从 ”的 研究 较 少 ,因此 本 文 涉及 的 评价 源 主要 包括 上 
而 导致 他 们 提高 对 管理 者 的 评分 (Atwater，Brett， 级 、 同 级 、 下 级 及 被 评价 者 本 身 。 
& Charles，2007)。 因 此 ， 多 源 评价 过 程 应 坚持 匿 31 评价 源 间 的 评价 一 致 性 
名 性 原则 ， 以 保证 评价 结果 的 准确 性 。 同 时， 评价 虽然 已 有 研究 证 明了 ， 多 源 评价 中 自我 评 
量 表 的 制定 也 对 评价 结果 有 一 定 的 影响 。 多 源 评 。“” 价 、 同 级 评价 、 上 级 评价 及 下 级 评价 间 的 测量 等 
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价 性 ， 即 表明 不 同 评价 源 间 的 评价 结果 ， 可 直接 
进行 比较 (Facteau & Craig, 2001; Woehr, Sheehan, 
& Bennett, 2005)。 然 而 ,由 于 员工 在 各 类 评价 源 
面前 ， 所 表现 的 行为 不 同 (Braddy，Gooty，Fleenor， 
& Yammarino，2014)， 各 类 评价 源 所 关注 的 重点 
也 有 差异 (Semeijn， Van Der Heijden, & Van Der 
Lee, 2014)， 因 而 带 来 了 不 同 评价 源 间 一 致 性 的 问 
题 。 以 往 研究 证 实 了 ， 多 源 评价 中 不 同 评价 源 间 
的 评价 一 致 性 较 低 (Hassan & Rohrbaugh, 2009; 
Beus, Jarrett, Bergman, & Payne, 2012; Braddy et 
al., 2014). 4 Semeijn 等 (2014) 认 为 ， 同 级 评价 与 
下 级 评价 间 的 分 歧 最 大 ， 旦 同类 评价 源 的 内 部 一 
BME, 要 高 于 评价 源 间 的 一 致 性 。 同 时， 相关 学 者 
还 从 各 个 方面 探讨 了 其 原因 ,包括 评价 者 个 性 特 
征 (Randall & Sharples，2012)， 工 作 环 境 氛 围 
(Rosen, Kacmar, Harris, Gavin, & Hochwarter, 
2017)， 及 文化 特征 (Atwater， Wang, Smither, & Fleenor, 
2009; Eckert, Ekelund, Gentry, & Dawson, 2010) 
等 。 其 中 , 文化 的 影响 作用 具体 表现 为 ，Atwater 
等 (2009) 探 讨 了 国家 文化 对 于 自我 -他 人 评价 间 一 
致 性 的 调节 作用 ,并 得 出 在 高 独断 性 (assertiveness) 
及 高 权力 距离 (power distance) 的 文化 背景 下 ， 管 
理 者 的 自我 评价 与 同 级 评价 、 下 级 评价 间 的 一 致 
性 相对 更 高 。 另 外 , 评价 源 间 的 不 一 致 问 题 ， 会 同 
时 影响 评价 者 与 被 评价 者 的 行为 。Amundsen 和 
Martinsen (2014) 的 研究 证 明 , 在 对 中 层 管理 者 进 
行 授权 领导 行为 评价 时 ， 自 我 评价 低 于 上 级 评价 
时 ,该 管理 者 的 领导 效能 更 高 ， 当 自我 评价 高 于 
下 级 评价 时 , 下 级 的 工作 满意 度 则 更 低 ， 离 职 倾 
向 相对 更 高 。Kopperud, Martinsen 和 Humborstad 
(2014) 证 明了 ， 中 层 管理 者 的 自我 评价 低 于 下 级 
评价 时 ,组 织 的 服务 氛围 (service climate) 会 更 高 。 

在 多 源 评 价 一 致 性 问题 研究 中 ， 自 我 评价 与 
他 人 评价 间 的 一 致 性 (self-others rating agreement) 
问题 受到 的 关注 最 多 (Amundsen & Martinsen, 
2014; Kopperud et al., 2014; Markham, Markham, 
& Smith, 2015)。 自 我 -他 人 评价 一 致 性 ， 通 常 受到 
性 别 、 年 龄 及 种 族 等 人 口 统计 特征 , 个 性 品质 及 
相关 外 在 环境 的 影响 (Fleenor，Smither，Atwater, 
Braddy, & Sturm, 2010)。 如 男性 和 年 老 的 员工 容易 
高 估 自 己 的 绩效 (Vecchio & Anderson，2009)， 黑 人 
相对 于 白人 来 说 常 为 高 估 者 (Bernardin, Konopaske, 
& Hagan, 2012)。 男 外 ， 由 于 不 同 评价 源 间 的 一 致 
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性 较 低 ， 以 往 对 评价 结果 直接 平均 的 做 法 ,会 造 
成 部 分 重要 信息 的 丢失 (Markham et al., 2014)。 
此 ，Markham 等 学 者 基于 组 内 和 组 间 分 析 (within 
and between analysis), 利用 相关 指标 , 探讨 了 多 源 
评价 中 同一 评价 源 组 内 平均 (Markham et al., 2014) 
以 及 不 同 评价 源 组 间 平 均 ,包括 自我 -下 级 评价 
间 (Markham et al.，2015) 和 自我 ~- 同 级 评价 间 
(Markham, Markham, & Smith, 2017) 的 平均 问题 ， 
并 得 出 不 是 任何 时 候 都 能 对 多 源 评价 结果 ， 采 用 
直接 平均 的 方式 ， 需 满足 一 定 的 标准 条 件 。 可 见 ， 
如 何 提高 多 源 评价 中 不 同 评价 源 间 的 一 致 性 问题 ， 
是 今后 多 源 评 价 研究 的 重要 方向 。 
3.2 ”评价 源 与 评价 偏 误 

E HE X M (halo effect) 和 宽大 效应 (leniency 
effecbD)， 是 多 源 评价 过 程 中 常见 的 两 大 评价 偏 误 
(rating biases) (Pulakos & O’Leary, 2011)， 影 响 着 
绩效 评价 的 有 效 性 (Hoffman et al., 2010; Ng, Koh, 
Ang, Kennedy, & Chan, 2011; O’Neill, Goffin, & 
Gellatly, 2012) 。 其 中 , 尝 轮 效应 指 在 被 评价 者 某 
种 特征 的 影响 下 ,形成 固有 的 印象 ， 从 而 产生 以 
偏 概 全 的 认 知 偏 误 ; 而 宽大 效应 则 指 评价 者 在 对 
他 人 的 评价 的 过 程 中 ， 相 对 于 负面 评价 ， 更 倾向 
于 正面 的 肯定 与 夸赞 。 
基于 对 相关 文献 (Antonioni & Park, 2001; Ng 
et al., 2011 等 ) 的 总 结 分 析 , 不 同 评 价 源 产 生 评 价 
偏 误 的 概率 存在 差异 。 其 中 ， 自 我 评价 过 程 中 出 
现 宽大 效应 的 概率 相对 最 大 , 却 较 少 出 现 晕 轮 效 
应 。 基 于 归 因 理论 和 自我 提升 理论 ， 这 可 能 是 因 
为 个 体 为 了 维持 较 好 的 自我 感觉 , 会 扭曲 部 分 信 
息 ， 把 成 功 的 原因 归于 自己 ,而 将 失败 归结 于 环 
境 或 他 人 的 问题 。 在 下 级 评价 中 ， 两 类 评价 偏 误 
出 现 的 概率 都 很 大 ， 且 会 随 着 对 被 评价 者 观察 时 
间 的 增加 而 增强 (Antonioni & Park, 2001)。 这 与 下 
级 对 上 级 评价 时 ， 担 心 其 会 受到 报复 行为 的 心理 
有 关 。 同 级 评价 出 现 两 类 评价 偏 误 的 可 能 性 差 不 
多 ， 常 处 于 选择 正面 评价 或 负面 评价 之 间 徘 徊 。 
因而 ， 相 对 于 其 他 评价 源 来 说 ， 上 级 评价 的 结果 
相对 更 准确 。 

另外 , 评价 偏 误 受 评价 者 与 被 评价 者 间 的 工 
作 关 联 性 影响 。 如 Spence 和 Keeping (2010) 提 出 ， 
评价 者 的 动机 会 影响 其 对 被 评价 者 的 评分 如 上 
级 为 了 培养 下 属 忠 诚 度 ， 会 夸大 其 业绩 ; 下 级 为 
了 避免 上 级 的 报复 ,会 故意 抬 高 对 其 评分 ; 而 同 
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级 之 间 ， 由 于 存在 竞争 关系 ， 可 能 会 故意 压低 评 
分 。 评 价 者 的 自身 特点 ， 也 会 影响 评价 偏 误 及 评 
价 准确 性 。 如 评价 者 的 自我 建构 (self-construal) 
(Mishra & Roch, 2013)， 人 格 特征 如 责任 感 (Mero，, 
Guidice, & Brownlee, 2007; Bernardin, Tyler, & 
Villanova, 2009) X [fi Al ME (Wood, Harms, & 
Vazire, 2010; Bono, Hooper, & Yoon, 2012) Al 
Zo Bernardin, Thomason, Buckley 和 Kane (2016) 
的 最 新 研究 发 现 ,随和 性 较 高 ， 自 信心 较 低 及 绩 
效 管理 能 力 较 差 的 评价 者 ， 更易 带 来 评价 偏 误 ， 
降低 评价 的 准确 性 。 同 时 ,文化 也 会 对 不 同 评价 
源 的 评价 造成 影响 。 比 如 , 个 人 主义 倾向 高 的 管 
理 者 , 会 更 容易 提高 对 自我 的 评价 (Xie,，Chen, & 
Roy, 2006); 若 组 织 文 化 宣扬 “合作 ”而 不 是 “ 竞 
争 ”， 则 同 级 评价 中 故意 压低 评分 的 现象 将 减少 
(Conway, Lombardo, & Sanders, 2001). Kossek, 
Huang, Piszczek, Fleenor 和 Ruderman (2017) 证 明 ， 
评价 者 与 被 评价 者 间 的 文化 距离 (culture distance), 
即 两 者 的 文化 差异 程度 ,也 会 影响 评价 结果 ， 
受到 文化 特征 的 调节 作用 ,具体 表现 为 ， 在 低 权 
力 距离 和 高 人 性 取向 的 环境 下 , 文化 距离 对 同 级 
评价 的 负面 影响 作用 ,会 相对 减弱 。 


4 多 源 评价 中 的 被 评价 者 


4.1 对 评价 过 程 的 接受 性 

个 体 对 多 源 评 价 过 程 的 接受 意愿 ， 受 到 自身 
个 性 特征 的 影响 。 如 具有 开放 精神 的 员工 ， 会 
愿意 接受 多 源 评价 , 并 认为 其 是 有 价值 的 (Smither 
London, & Reilly, 2005); 自我 效能 感 (self-efficacy) 
较 高 的 个 体 ， 对 多 源 评价 持 有 更 积极 的 态度 ， 
在 绩效 评价 之 后 获得 更 多 的 提升 (Heslin & 
Latham, 2004)。 因为， 自我 效能 感 较 高 的 个 体 ,会 
关注 如 何 分 析 和 解决 问题 ， 而 不 是 一 味 地 担心 失 
Wo Atwater 等 (2007) 的 研究 也 发 现 ， 具有 较 高 自 
我 效能 感 的 个 体 ， 在 绩效 评价 之 后 更 愿意 与 评价 
者 见面 ， 与 上 级 领导 讨论 ,并 制定 相关 的 改进 目 
标 , 同时 也 会 更 有 动力 使 用 绩效 评价 结果 。 而 具 
有 犬 颂 思 想 的 个 体 ， 对 组 织 持 嘲 讽 态度 时 ， 即 不 
相信 组 织 中 存在 积极 的 改变 , 或 认为 个 人 努力 在 
组 织 中 无 意义 , 会 更 容易 拒绝 多 源 评价 (McCarthy 
& Garavan, 2007)。 男 外 ,组 织 文 化 也 会 影响 个 体 
对 多 源 评价 的 接受 度 。London 和 Smither (2002) 
提出 ， 如 果 组 织 内 建立 了 “反馈 文化 (feedback 
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culture)”， 即 个 体 经 常 接受 或 请 求 ， 获 得 正式 或 非 
正式 的 反馈 来 提高 自己 的 工作 绩效 , 个 体会 更 愿 
意 接受 多 源 评价 。 

4.2 ”对 评价 结果 的 反应 

当 个 体 收 到 多 源 评价 结果 后 ， 受 各 种 因素 的 
影响 , 会 表现 出 不 同 的 反应 (reaction), 但 学 者 们 
对 “反应 ”的 相关 概念 并 没有 统一 的 标准 (Pichler, 
2012; Brown & Benson, 2003)。 基 于 对 现 有 研究 的 
总 结 分 析 ， 本 文 将 个 体 对 评价 结果 的 反应 分 为 三 
类 : 感知 反应 ,包括 准确 性 、 公 平 性 及 有 用 性 ; 情 
RRM, 包括 满意 度 , 积极 情绪 与 消极 情绪 ; 行 
为 反应 ,包括 绩效 改进 动力 , 设立 更 具体 的 目标 ， 
与 他 人 分 享 评价 结果 ,向 上 级 领导 求助 等 。 同 时 ， 
还 分 析 了 三 大 个 体 反应 间 的 相互 关系 ， 如 图 2 所 
示 。 当 被 评价 者 感知 评价 结果 是 准确 、 公 平 且 有 
效 的 ,会 提高 其 对 评价 结果 的 情感 反应 ， 表 现 出 
较 高 的 满意 度 及 积极 的 情绪 ， 从 而 增强 其 行为 反 
应 , 具体 表现 为 充满 改进 动力 , 设置 具体 的 目标 
计划 ,向 他 人 分 享 结果 ,并 寻求 帮助 等 。 


对 评价 结果 的 反应 


感知 反应 情感 反应 行动 反应 


* 感 知 准确 性 + 满意 度 + 改进 动力 
* 感 知 公 平 性 | ”>| * 积极 情绪 * 设 定 目 标 


* 消极 情绪 * 分 享 结果 
* 寻 求 帮助 


个 


+ 感知 有 用 性 


图 2 个 体 对 多 源 评 价 评价 结果 的 反应 


员工 对 多 源 评价 结果 的 反应 ,受到 很 多 因素 
的 影响 , 包括 评分 值 (高 或 低 )、 个 性 特征 、 反 馈 信 
号 (正面 或 负面 ) .自我 评价 与 他 人 评价 间 的 差距 等 ， 
并 受到 个 体 目标 定向 、 个 性 特征 等 的 调节 作用 。 
其 中 ,绩效 评价 结果 的 分 值 越 高 ,往往 被 评价 者 
的 满意 度 也 越 高 (Judge & Bono, 2001; Kampk6tter, 
2017)。 然而 , Luffarelli, Goncalves 和 Stamatogiannakis 
(2016) 的 研究 表明 ,该 结果 仅 针 对 被 评价 者 的 社 
会 比较 倾向 (social comparison orientation) 较 低 时 
而 成 立 。 被 评价 者 的 个 性 特征 的 影响 作用 可 表现 
为 , 经 验 开放 性 较 高 的 员工 ， 对 评价 结果 更 易 产 
生 较 高 的 满意 度 (Krasman，2010); 当 评 价 结果 不 
与 奖金 相关 时 , 评价 结果 对 员工 工作 满意 度 的 影 
响 ， 受 到 控制 点 (locus of control) 及 经 验 开放 性 的 
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负 向 调节 作用 (Kampkatter 2017)。 
反馈 信号 (feedback sign) 是 指 根据 反馈 内 容 
的 特点 ， 将 反馈 分 为 正面 反馈 和 负面 反馈 两 类 。 
被 评价 者 常 认 为 正面 反馈 比 负面 反馈 ， 更 加 正确 
和 有 用 (Brett & Atwater, 2001)， 从 而 更 乐意 接受 
反馈 结果 (McCarthy & Garavan，2007)， 表 现 出 较 
高 的 满意 度 及 积极 的 行为 反应 (Culbertson, Henning, 
& Payne, 2013), 绩效 也 更 易 获得 提高 (Smither & 
Walker，2004)。 而 负面 反馈 常 被 员工 认为 是 不 公 
平 ， 不 准确 ， 缺乏 有 用 性 的 (Brett & Atwater, 
2001), 他们 会 选择 忽视 或 者 不 接受 反馈 结果 ， 表 
现 出 较 低 的 满意 度 及 消极 的 情感 反应 (Culbertson 
et al., 2013)。 但 Brett 和 Atwater (2001) 认 为 ,这 只 
是 短暂 的 情绪 反应 ， 当 几 周 过 后 ,反馈 信号 与 感 
知 反应 间 并 不 存在 相关 性 。 同 时 , Smither 等 (2005) 
发 现 当 被 评价 者 收 到 差 评 时 ， 刚 开始 会 出 现 消极 
的 反应 , 但 当 6 个 月 之 后 ,他 们 会 设 定 更 多 改进 
目标 。 另 外 ,被 评价 者 对 正面 或 负面 反馈 结果 的 
反应 ， 还 受到 个 体 目 标定 向 的 调节 作用 (Heslin & 
Latham, 2004; Culbertson et al., 2013). 
自我 -他 人 评价 间 的 差异 ， 也 影响 着 被 评价 
者 对 评价 结果 的 反应 。 当 自我 评价 高 于 他 人 评价 
时 ， 被 评价 者 常会 对 反馈 结果 产生 消极 的 情感 反 
应 ， 而 不 同 的 评价 源 下 的 情况 不 同 。 当 被 评价 者 
高 估 自 己 时 ,会 表现 出 生气 .抱怨 等 负面 情绪 ， 特 
别 是 收 到 较 低 的 同 级 与 上 级 评价 时 ; 而 对 下 级 的 
负面 评价 则 不 易 出 现 消极 情绪 (Brett & Atwater, 
2001), 反而 会 负 向 影响 下 级 的 行为 ， 如 增加 下 级 
的 离职 倾向 (Amundsen & Martinsen, 2014)。 当 自 
我 评价 低 于 他 人 评价 时 , 虽然 不 一 定 会 带 来 积极 
的 行为 反应 (Brett & Atwater, 2001), 但 被 评价 者 
的 满意 度 会 变 得 更 高 (Bono & Colbert, 2005), H. 
受到 相关 调节 变量 如 员工 的 核心 自我 评价 (Bono 
& Colbert, 2005), 评价 分 值 高 低 (Atwater & Brett, 
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评价 ,， 最终 提升 其 绩效 。 以 往 研究 证 明了 多 源 评 
价 后 ,员工 行为 发 生 了 改变 , 绩效 获得 了 提升 
(London & Smither, 1995)， 且 工作 满意 度 也 被 提 
高 ， 离 职 率 降低 ， 工 作 投 入 感 更 强 (Atwater & 
Brett, 2006)。 Shipper, Hoffman 和 Rotondo (2007) 
证 实 了 360 度 反 馈 能 够 带 来 认 知 、 情 感 、 行 为 及 
产 出 成 果 的 提升 , 但 受到 国家 文化 的 影响 作用 ， 
具体 表现 为 ， 在 低 权力 距离 及 高 个 人 主义 的 文化 
背景 下 , 360 度 反 馈 会 相对 更 有 效 。 然 而 ， 也 有 学 
者 得 出 的 评价 结果 不 确定 (Carson, 2006), Kim 等 
(2016) 认 为 ,多 源 评 价 对 于 组 织 绩效 的 影响 是 间 
接 的 ,主要 通过 提高 员工 的 能 力 与 知识 共享 技能 ， 
从 而 提高 财务 业绩 。 

综 上 所 述 , 虽然 多 源 评价 在 国外 企业 中 的 发 
展 已 较为 成 熟 , 但 其 所 带 来 的 最 终 绩 效 改 进 效 果 
却 并 不 稳定 。 基 于 对 现 有 文献 的 梳理 与 总 结 ， 本 
文 以 被 评价 者 的 "感知 反应 -情感 反应 -行为 反应 - 
绩效 改进 结果 ”为 主线 , 将 多 源 评价 中 所 涉及 的 
主要 因素 间 的 相互 关系 , 作出 了 如 下 图 3 所 示 的 
结构 图 。 从 图 3 中 可 看 出 , 影响 员工 最 终 绩效 是 
否 能 够 提升 的 因素 很 多 , 包括 直接 效应 与 间接 效 
应 , 如 员工 对 反馈 结果 的 感知 反应 、 和 情感 反 应 及 
行为 反应 的 不 同 ,都 会 导致 不 同 的 绩效 改进 结 
Ro 因此, 绩效 改进 结果 的 研究 结论 出 现 差异 ， 也 
是 符合 情理 的 。 
6 结论 与 研究 展望 
6.1 结论 

多 源 评 价 已 成 功 的 在 许多 企业 中 运行 , 不 仅 
带 来 了 个 人 绩效 提升 , 还 能 推动 组 织 的 进一步 发 
展 (Karkoulian, Assaker, & Hallak, 2016)。 本文 从 多 
源 评价 过 程 、 评 价 源 及 被 评价 者 三 个 方面 对 国 
外 多 源 评价 的 特点 及 内 在 机 制 进行 了 总 结 与 分 
析 。 发 现 多 源 评价 所 带 来 的 绩效 改进 结果 并 不 稳 


2005) 等 的 影响 。 男 外 ,组 织 环 境 也 会 影响 员工 对 
评价 结果 的 反应 。 如 Miller, Verbos, & Goswami 
(2014) 证 明了 工作 的 环境 与 相关 资源 .公司 沟通 交 
流 的 开放 程度 、 与 同事 间 的 关系 及 为 准备 绩效 评 
价 所 投入 的 时 间 ,， 都 会 正 向 影响 员工 对 绩效 评价 
结果 的 反应 。 


5 多 源 评 价 结果 
多 源 评价 的 核心 


的 是 通过 对 员工 多 方面 的 


定 ， 并 受到 各 种 影响 因素 的 直接 或 间接 的 影响 。 
从 上 图 3 中 可 得 , 各 变量 间 的 关系 错综复杂 ,其 
中 个 体 对 反馈 结果 的 情感 反应 及 行为 反应 ,受到 
的 影响 因素 最 多 。 而 文化 特征 、 个 人 性 格 特点 及 
个 体 目 标定 向 ,是 多 源 评 价 研究 中 常用 的 调节 变 
量 。 因 此 ,企业 若是 在 运用 多 源 评价 之 前 ， 能 搞 清 
楚 评 价 前 后 所 涉 变量 间 的 相关 关系 ， 对 有 效 地 运 
用 多 源 评价 将 大 有 神 益 。 

另外 ， 多 源 绩 效 评价 不 能 直接 引用 ， 需 根据 
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引导 者 


评价 形式 


rm 


评价 目的 
反馈 结果 


图 3 多 源 评价 中 所 涉及 的 主要 因素 


本 国 的 文化 特点 等 ， 进 行 相应 的 改进 与 完善 
(Harbi, Thursfield, & Bright, 2017)。 因 而 ， 多 源 评 
价 在 我 国企 业 中 运用 时 ， 应 注意 与 我 国文 化 特点 


价 系统 本 身 特点 、 员 工 个 人 特征 及 其 与 评价 者 间 
的 关系 ,都 影响 着 员工 看 待 绩效 评价 的 可 视 性 、 


相 结 合 。 具 体 来 说 , 我 国 的 文化 特征 主要 表现 为 ， 
高 权力 距离 、 集 体 主义 、 不 确定 性 规避 程度 较 高 ， 
以 及 注重 人 际 关 系 ， 即 所 谓 的 “关系 文化 ”, 在 该 文 
化 背景 下 ， 较 容易 出 现下 级 夸大 对 上 级 的 绩效 评 
价 ， 同 部 门 员工 间 相 互 评 价 被 抬 高 ， 而 压低 对 其 
他 部 门 员 工 的 评价 等 偏 误 。 同 时 ， 较 高 的 不 确定 
性 规避 文化 背景 ,也 难以 适应 多 源 评 价 所 需 的 高 
度 开 放 性 和 互动 性 。 为 了 避免 上 述评 价 偏 误 的 发 
E, 我 国企 业 在 运用 多 源 评 价 时 ， 应 该 制定 严格 
且 透 明 的 绩效 考核 体系 ,避免 “形式 化 ”， 如 让 员 
工 明确 考核 目的 及 重要 性 , 制定 合理 的 考核 指标 ， 
建立 起 组 织 的 “反馈 文化 ” 真正 遵循 公开 .公正 及 
公平 原则 。 
6.2 ”未 来 研究 展望 

通过 上 述 分析 ， 发现 多 源 评价 所 带 来 的 绩效 
改进 结果 并 不 稳定 。 因 而 ,未 来 的 研究 应 从 如 何 
改进 多 源 评价 ， 以 获得 稳定 的 绩效 改进 结果 方面 
进一步 开展 相关 的 研究 。 

第 一 ， 关 于 如 何 提高 评价 多 源 评价 过 程 的 有 
效 性 与 准确 性 问题 ， 目 前 的 研究 还 很 少 。 绩 效 评 


效 性 及 公平 性 (Sumelius，Bjarkman，Ehrnrooth， 
Mäkelä, & Smale, 2014)。 当 员工 认为 绩效 评价 过 
程 不 公平 时 , 会 表现 出 负面 态度 ， 如 降低 组 织 认 
同感 (Farndale & Kelliher, 2013)， 并 影响 其 工作 满 
意 度 (Yamazaki & Yoon, 2016)。 因 而 ， 对 多 源 评价 
过 程 的 有 效 性 进行 评估 与 衡量 ， 对 于 整个 绩效 评 
价 的 完善 与 改进 有 着 重要 影响 。 可 参考 对 传统 绩 
效 评价 有 效 性 ， 所 提出 的 相关 标准 及 评价 结构 ， 
如 结合 评价 的 目的 性 、 公 平 性 、 准 确 性 ， 以 及 该 
三 大 标准 与 被 评价 者 反应 间 的 关系 ,提出 评估 绩 
效 评价 效果 的 相关 指标 与 方法 (Iqbal,，Akbar, & 
Budhwar, 2015; Ikramullah, van Prooijen, Lqbal, & 
Ul-Hassan, 2016) 。 

第 二 ,被 评价 者 对 评价 结果 的 反应 ,对 其 后 
续 的 绩效 改进 行为 影响 较 大 。 人 然而, 关于 个 体 对 
评价 结果 反应 的 研究 中 ,学 者 们 对 被 评价 者 的 
“反应 ”界定 不 清晰 ,基于 此 ， 本 文 将 个 体 反 应 分 为 
三 类 , 并 提出 了 “感知 反应 -情感 反应 -行为 反应 ” 
的 基本 路 径 , 但 该 分 类 及 三 者 之 间 的 关系 是 否 准 
确 ,还 需要 未 来 作 进一步 验证 与 探讨 。 今 后 的 研 
究 可 在 本 文 的 基础 上 ,针对 细 分 的 “反应 ”类 型 ， 
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对 被 评价 者 对 多 源 评价 结果 的 反应 进行 更 深入 的 
探讨 ， 通 过 改善 被 评价 者 对 评价 结果 的 反应 情况 ， 
从 而 促进 其 绩效 改进 行为 。 

最 后 ， 如 何 对 多 源 评 价 结果 进行 汇总 ， 也 是 
重要 的 研究 问题 。 多 源 评价 过 程 中 ， 对 不 同 的 评 
价 主 体 的 评分 , 大 多 都 是 以 总 平均 的 方式 汇总 ， 
或 保持 每 类 评价 源 的 独立 评分 。 然 而 , 不同 的 评 
价 源 的 观察 角度 有 差异 ， 应 根据 不 同 的 评价 指标 ， 
予以 不 同 的 评价 权重 。 比 如 ,在 团队 合作 能 力 考 
核 指 标 中 ， 同 一 团队 的 同 级 评价 者 与 被 评价 者 接 
触 时 间 更 多 ， 对 被 评价 者 在 团队 合作 方面 的 能 力 
相对 更 了 解 ， 因 而 同 级 评价 所 占 权 重 应 最 大 。 关 
于 多 源 评 价 中 不 同 评价 源 评分 的 赋 权 问题 ， 目 前 
还 少 有 文献 讨论 过 。 虽然 Markham 等 (2014, 2015， 
2017) 提 出 不 能 对 多 源 评价 结果 直接 平均 , 但 其 
没有 对 各 评价 源 间 如 何 赋 权 进行 研究 。 对 每 类 评 
价 源 给 与 科学 合理 的 权重 ,能 给 员工 提供 更 准确 
的 反馈 结果 ， 从 而 促进 其 后 续 绩效 改进 行为 。 因 
而 ， 未 来 的 研究 应 注重 如 何 对 评价 结果 进行 科学 
有 效 的 汇总 ， 以 减少 不 同 评价 源 带 来 的 偏 误 。 
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Abstract: Although the multisource feedback in foreign enterprises has become mature, it is still 
underdeveloped in China. Based on extant studies, we discuss and analyze the characteristics and internal 
mechanism of multisource feedback through three constructs, including appraisal process, rater sources, and 
ratee. From the perspective of appraisal process, multisource feedback has various objectives, and it often 
preserves the anonymity of raters as well as managers should pay attention to reasonably using appraisal 
results. In terms of the rater sources, the level of rating agreement between different raters is low, and raters 
often make halo error and leniency effect easily. From the view of ratee, the reaction of individuals to the 
feedback results is impacted by personality, feedback signal, and self-others agreement, etc. Additionally, 
the studies also show the influence of multisource feedback on performance is unstable. Based on these 
findings, there is a need for further study on how to enhance the validity and accuracy of appraisal process, 
improve individuals’ reaction, and summarize the results of multisource feedback. 
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